Scale-up 光互连
一句话定义
AI 集群机柜内部 GPU-GPU 互联的网络层。当前主要由铜缆承担,但随着单机柜 GPU 数从 8 颗(DGX)跃升到 72 颗(NVL72)甚至 576 颗(NVL576),224G+ 速率下铜缆距离缩短到 <0.5m,光互连进入机柜内成为必然。Scale-up 是 NPO 的主战场,Lightcounting 预测 2030E 占总光模块市场 21%。
一、AI 网络的三层结构
flowchart TB
subgraph 跨数据中心["跨数据中心(Scale-across)"]
DC1[数据中心 1]
DC2[数据中心 2]
DC1 -.DCI 长距相干.- DC2
end
subgraph 数据中心内["数据中心内(Scale-out)"]
Rack1[机柜 1<br/>NVL72 等]
Rack2[机柜 2]
Rack3[机柜 3]
Rack1 -.800G/1.6T 可插拔光模块.- Rack2
Rack2 -.800G/1.6T 可插拔光模块.- Rack3
end
subgraph 机柜内["机柜内(Scale-up)"]
direction LR
GPU1[GPU 1]
GPU2[GPU 2]
GPU3[...]
GPU72[GPU 72]
GPU1 -.铜缆/光互连.- GPU2 -.铜缆/光互连.- GPU3 -.铜缆/光互连.- GPU72
end
DC1 --> Rack1
Rack1 --> GPU1
style 机柜内 fill:#fef3c7,stroke:#d97706,stroke-width:3px;
三层网络对比
| 层级 | 距离 | 当前主流 | 演进方向 | 占比 |
|---|---|---|---|---|
| Scale-across | 公里 - 数十公里 | 800G ZR 相干 | TFLN / 1.6T ZR | <5% |
| Scale-out(机柜间) | 5-50 米 | 800G/1.6T 可插拔 | 1.6T LPO / NPO | ~75% |
| Scale-up(机柜内) | <2 米 | 铜缆 / DAC | 光互连 / NPO | 21%(2030E) |
二、为什么铜缆撑不住
graph LR
A[100G/通道<br>铜缆 ~3m] --> B[200G/通道<br>铜缆 ~1.5m]
B --> C[400G/通道<br>铜缆 <0.5m]
C --> D[需要光互连进入机柜]:::core
classDef core fill:#fef3c7,stroke:#d97706,stroke-width:3px;
物理瓶颈
- 224G/通道(200G PAM4):铜缆 SerDes 链路距离已缩短至 0.5-1m
- 448G/通道(下一代):铜缆基本无法满足
- 链路损耗:铜缆每米损耗与频率正相关,高速时指数级恶化
- 散热与重量:单根高速铜缆截面大、重量大,机柜布线压力剧增
NV NVL72 / NVL576 拉动
| 系统 | 单机柜 GPU 数 | 内部互连方式 | 光模块需求 |
|---|---|---|---|
| DGX A100 | 8 | NVLink + 铜缆 | 几乎无 |
| DGX H100 | 8 | NVLink + 铜缆 | 极少 |
| NVL72 | 72 | NVLink + 铜缆(极限)+ 部分光 | 早期 |
| NVL576 | 576 | 必须光互连 | 大量 |
三、Scale-up 光互连的形态选择
| 形态 | 优势 | 劣势 | 商业化进度 |
|---|---|---|---|
| AOC(有源光缆) | 成熟、即插即用、VCSEL 主流 | 单 bit 功耗较高 | 已量产 |
| NPO(近封装光学) | 功耗低、密度高 | 量产难度大 | 2026-2027 主线 |
| CPO(共封装) | 极致功耗 | 良率低、可维护性差 | 2027-2028 |
| 铜缆(继续用) | 成本最低 | 距离 + 高速受限 | 224G+ 已边缘化 |
四、A 股受益玩家
| 公司 | 卡位 | 关键证据 |
|---|---|---|
| 中际旭创 | NPO 押注 | 客户定性指引明确,2027 量产;OFC 2026 展示 NPO 产品 |
| 新易盛 | 跟随 | 1.6T 量产 + NPO 储备 |
| 天孚通信 | 光引擎封装受益 | NPO 时代光引擎价值量提升 3-5 倍 |
| 长光华芯 | VCSEL 配套 | 800G AOC 主流光源(详见 上游_VCSEL) |
| 源杰科技 | CW 光源配套 | NPO 大规模光端口拉动 CW 需求 |
五、关键投研议题
议题 1:Scale-up 光互连是 AI 数通最大增量
Lightcounting 预测 2030E Scale-up 占总光模块市场 21%。这部分是从 0 到 1 的全新需求——不替代 Scale-out,而是叠加。
议题 2:NPO 客户定量订单时点是关键
中际旭创 已获客户定性NPO 需求指引,但定量订单时点是看多公司增长曲线衔接的关键证据。一旦释放,意味着 1.6T 可插拔到 NPO 的产品代际无缝过渡。
议题 3:NV NVL576 路线图 vs CPO/NPO 选型
Nvidia 在 GTC 2025 公开 NVL576 路线图涉及光互连,但具体选型(NPO vs CPO vs 自研形态)尚未明确。这是 2026-2027 行业最大不确定性之一。
六、跟踪指标
- NV NVL72 / NVL576 出货量 — Scale-up 需求规模锚点
- 中际旭创 NPO 客户定量订单时点 — 关键节点
- NPO 单端口 ASP — 价值量验证
- 800G AOC vs NPO 在 Scale-up 的份额变化 — 形态竞争结果
七、相关页面
相邻概念
NPO · CPO · Scale-out 网络 · Scale-across 网络 · AOC (有源光缆) · 硅光
涉及公司
中际旭创 · 新易盛 · 天孚通信 · 长光华芯 · 源杰科技 · 英伟达 · 博通
涉及环节
中游_光模块 · 中游_光引擎子系统 · 下游_云厂商数通
八、来源
- 中际旭创_机构研报_投资逻辑
- 中际旭创_机构研报_公司一页纸
- [2026-03_OFC 2026 展示 NPO-XPO-OCS]
- Lightcounting 报告:AI 光模块占比与 Scale-up 预测
- Nvidia GTC 2025 公开材料:NVL576 路线图